智能论文笔记

Whois? Deep Author Name Disambiguation using Bibliographic Data

Zeyd Boukhers , Nagaraj Asundi Bahubali

分类：自然语言处理 | 机器学习

2022-07-11

随着作者的数量在多年来呈指数增长，共享相同名称的作者数量正在按比例增加。这使得将新发表的论文分配给其足够的作者是一项挑战。因此，作者名称歧义（ANA）被认为是数字库中的关键开放问题。本文提出了一个作者名称歧义（和）方法，该方法通过利用其合着者和研究领域来将作者姓名与其现实世界实体联系起来。为此，我们使用了DBLP存储库中的收藏集，其中包含大约260万名合着者撰写的超过500万本书目记录。我们的第一组作者共享相同的姓氏和相同的名字名称。通过捕获与他/她的合着者和研究领域的关系来确定每个小组内的作者，这是由相应作者的经过验证的出版物的标题代表的。为此，我们训练一个神经网络模型，该模型从共同作者和标题的表示中学习。我们通过在大型数据集上进行大量实验来验证方法的有效性。

translated by 谷歌翻译

由于自然语言处理和基于计算机视觉模型的显着进步，视觉问题应答（VQA）系统变得越来越聪明，高级。然而，在处理相对复杂的问题时，它们仍然易于出错。因此，在采用结果之前了解VQA模型的行为非常重要。在本文中，我们通过生成反事实图像来引入VQA模型的可解释方法。具体地，所生成的图像应该具有对原始图像具有最小可能的改变，并引导VQA模型来提供不同的答案。此外，我们的方法确保生成的图像是逼真的。由于无法使用定量度量来评估模型的可解释性，因此我们进行了用户学习，以评估我们方法的不同方面。除了在单个图像上解释VQA模型的结果，所获得的结果和讨论还提供了对VQA模型的行为的广泛解释。

translated by 谷歌翻译

物理运动模型为车辆运动提供了可解释的预测。但是，某些模型参数（例如与空气动力学和流体动力学相关的参数）非常昂贵，并且通常仅大致近似降低预测准确性。经常性的神经网络以低成本的价格实现了高预测准确性，因为它们可以使用车辆常规操作期间收集的廉价测量值，但是它们的结果很难解释。为了精确预测车辆状态，没有昂贵的物理参数测量，我们提出了一种混合方法，结合了深度学习和物理运动模型，包括新型的两阶段训练程序。我们通过将深神经网络的输出范围限制为混合模型的一部分来实现可解释性，这将神经网络引入的不确定性限制为已知数量。我们已经评估了船用和四轮运动的用例。结果表明，与现有的深度学习方法相比，我们的混合模型可以提高模型的解释性，而准确性没有降低。

translated by 谷歌翻译